課程資訊
課程名稱
生醫巨量資料處理與分析
Biomedical Big Data Processing and Analytics 
開課學期
105-2 
授課對象
工學院  醫學工程學研究所  
授課教師
蔣以仁 
課號
Biomed7114 
課程識別碼
548EM0390 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期二2,3,4(9:10~12:10) 
上課地點
 
備註
本課程以英語授課。先修課程:醫學資料庫。教室:基醫505。
總人數上限:30人
外系人數限制:5人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1052Biomed7114_ 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

第1部分:資料處理
1. 資料庫和資料關連 ?並行資料庫,並行查詢處理,資料庫內部分析
2. MapReduce,Hadoop,與資料庫的關連, 演算法,擴展 (scaling),語言
3. 鍵值存儲和NoSQL;SQL 和 NoSQL 優缺點分析
第2部分:分析
1. 統計建模:基本概念,實驗設計,常見錯誤
2. 機器學習:指導式學習(規則,數,森林,最近鄰點,回歸), 最佳化(梯度下降和變式), 非指導式學習、深度學習與加強式學習
第3部分:結果呈顯
1. 視覺化、資料視覺化呈現工具,視覺化資料分析 ?引用,隱私,倫理,管理
第4部分:探討
1. 圖型分析:資料結構,DFS 及 BFS 分析,網頁排名,social networks,遞迴查詢,語義網
 

課程目標
生醫巨量資料處理與分析將概述資料分析師與資料科學家在面對生醫資料、欲回答的問題與分析工具中經常遇到的問題。本課程分為兩部分,第一部分為建立將巨量資料轉化為可用知識的概念,第二部分為雲端巨量資料分析使用的分析系統介紹與資料清理等技巧。 
課程要求
專案實做
專題報告
作業
 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
無 
參考書目
Tom White, Hadoop: The Definitive Guide, O'Reilly Media, 2009.
Jure Leskovec, Anand Rajaraman, Jeff Ullman, Mining of Massive Datasets.
Jared Dean, Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and
Practitioners, Wiley.  
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
2/21  Introduction and High Dimension
核心能力:2、4、6、7 
第2週
2/28  Clustering Schemes
核心能力:1、2、4、6、7 
第3週
3/07  Clustering Schemes 2
核心能力:2, 3, 4, 6, 7 
第4週
3/14  CRISP-DM
核心能力:1, 2, 3, 4, 6, 7 
第6週
3/28  Association Rules
核心能力:2, 3, 4, 6, 7 
第7週
4/04  Support Vector Machine
核心能力:2, 3, 7 
第8週
4/11  Artificial Neural Networks
核心能力:2, 3, 4, 6 
第9週
4/18  Hadoop and SPARK
核心能力:2, 3, 4, 5, 6, 7 
第10週
4/25  RBF & Deelp Learning
核心能力:2, 4, 6, 7 
第11週
5/02  Feature selection
核心能力:2, 3, 4 
第12週
5/09  Deep Learning
核心能力:2, 3, 4, 6, 7 
第13週
5/16  Active Learning
核心能力:1, 2, 3, 4, 6, 7 
第14週
5/23  Deep Learning Code and Dataset
核心能力:2, 3, 4, 7 
第15週
5/30  Feature Selection
核心能力:2, 3, 4 
第16週
6/06  Bayesian Inference Model
核心能力:2, 3, 4, 6, 7 
第17週
6/13  Boosting
核心能力:2, 3, 4, 7 
第18週
06/20  期末問卷